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Mittel zur Diagnose und zur Therapie von Tumorerkrankungen 
Zusammenf assung 

Die Erfindung betrifft neue Wege zur Bekampfung von 
Tumorerkrankungen durch Ausnutzung molekularbiologischer 
Zusammenhange bei der Tuiaorentstehung . 

Der Erfindung liegt die Aufgabe zugrunde / ein Verfahren zur 
Kontrolle der Regulation von B-Catenin in Korperzellen zu 
entwickeln. 

Gegenstand der Erfindung ist ein neues Protein, welches an B- 
Catenin bindet und zu dessexn zytoplasmatischen Abbau fQhrt. 
Dieses Protein hat die Aminosauresequenz gemaB Abb. 1 und wurde 
als CONDUCTIN bezeichnet. 

Vom Vorkommen und der Wirkung des Conduct ins in Korperzellen 
abgeleitet werden Mittel zur Diagnose und zur Therapie von 
Tumorerkrankungen entwickelt. 



Paten tansprQche 



1. Mittel zur Diagnose von Tumoren, enthaltend eine Substanz, 
mit der 

- Conductin, seine Mutanten und Varianten oder Teile davon bzw. 

- Gene, die far Conductin , seine Mutanten und Varianten oder 
Teile davon kodieren, bzw. 

- m-RNA-Sequenzen, die von diesen Genen abgelesen werden, 
nachgewiesen werden. 

2. Mittel zur Diagnose von Tumoren nach Anspruch 1, enthaltend 
spezifische Antikorper gegen Conductin , seine Varianten oder 
Mutanten oder Teile davon. 

3. Mittel zur Diagnose von Tumoren nach Anspruch 1 und 2, 
dadurch gekennzeichnet , daB die spezifischen Antikorper 
monoklonale Antikorper sind. 

4. Mittel zur Diagnose von Tumoren nach Anspruch 1, enthaltend 
korrespondierende Oligonukleotid-Primer bzw. DNA-Sonden zum 
Nachweis der Gene und deren Mutationen. 

5. Mittel zur Diagnose von Tumoren nach Anspruch 1, enthaltend 
korrespondierende Oligonukleotid-Primer bzw. DNA-Sonden zum 
Nachweis der RNA-Seguenzen. 

6. Mittel zur Therapie von Tumoren, enthaltend eine Substanz, 
die die Wirkung des Conductins im Kdrper aktiviert/reaktiviert. 

7. Mittel nach Anspruch 6, enthaltend eine Substanz, die den 
Genpromoter des Conductins aktiviert. 

8. Mittel nach Anspruch 6, enthaltend eine Substanz, die die 
Stabilitat der mRNA-Sequenzen erhSht. 

9. Mittel nach Anspruch 6, enthaltend eine Substanz, die die 
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Aktivitat des Conductins erhoht. 

10. Conducting seine Varianten und Mutanten sowie Teile davon. 

11. Conductin nach Anspruch 10, gekennzeichnet durch die 
Aminosauresequenz 1-839 gemaB Abb. 1, wobei Abb. 1 Bestandteil 
dieses Anspruchs ist. 

12. Teilsequenz des Conductins nach Anspruch 10, gekennzeichnet 
durch die Aminosauresequenz 78-200 (RGS-Domane) der Abb. 1. 

13. Teilsequenz des Conductins nach Anspruch 10, gekennzeichnet 
durch die Aminosauresequenz 343-464 (B-Catenin- 
BindungsdomSne)der Abb. 1. 

14. Teilsequenz des Conductins nach Anspruch 10, gekennzeichnet 
durch die Aminosauresequenz 782-832 (Dishevelled Homologie- 
Region)der Abb. l. 

15. Teilsequenzen des Adenomatosis Poliposis Coli (APC) , 
gekennzeichnet durch die Aminosauresequenzen 1464-1604, 1516- 
1595, 1690-1778 und 1995-2083 als RGS-Domanen-Interaktionsorte. 

16. cDNA-Sequenz von Conductin, seiner Varianten oder Mutanten 
oder Teilen davon. 

17. cDNA-Sequenz des Conductins der Nukleotidf olge 1-3197 der 
Abb. 2, wobei Abb. 2 Bestandteil dieses Anspruchs ist. 

18. cDNA-Teilsequenz des Conductins der Nukleotidf olge 452-820 
(RGS-Genabschnitt)der Abb. 2. 

19 . cDNA-Teilsequenz des Conductins der Nukleotidf olge 1247-1612 
(Genabschnitt der B-Catenin-Bindungsdomane)der Abb. 2. 

20. cDNA-Teilsequenz des Conductins der Nukleotidf olge 2564-2716 
(Genabschnitt der Dishevelled Homologie-Region)der Abb. 2. 



21. Verwendung des Conductin-Gens fQr die Gentherapie von 
Tumor rkrankungen , dadurch gekennzeichnet , daB ein Vektor rait 
dem Conductin-Gen konstruiert wird, anschlieBend ein Gentransfer 
in den menschlichen KOrper erfolgt und dam it die Aktivitat des 
Conduct ins in Korperzellen wiederhergestellt wird. 



Be schr e ibung 



Die Erfindung betrifft neue Wege zur Bekampfung von 
Tumor erkrankungen durch Ausnut2ung molekularbiologischer 
Zusammenhange bei der Tumorentstehung. Sie betrifft im einzelnen 
ein Mittel zur Diagnose von Tuiaorerkrankungen , und darauf 
aufbauend ein Mittel zur Therapie. Sie betrifft ferner das neue 
Protein Conductin, seine Mutanten und Varianten sowie Teile 
davon, die dazu analogen cDNA-Sequenzen und deren Verwendung in 
gentherapeutischen und pharmakologischen Verfahren. 
Anwendungsgebiete der Erfindung sind die Medizin und die 
pharmazeutische Industrie . 

Cadherine und Catenine bilden Zelladhasionskomplexe, die in 
zahlreichen Geweben fur die Anheftung der Zellen aneinander 
verantwortlich sind. Die Cadherine sind Transmembranproteine und 
stellen den direkten Kontakt zwischen benachbarten Zellen her. 
a-, B- und y-Catenin sind zytoplasmatische Komponenten, die die 
Cadherine mit dem Aktin-Zytoskelett verbinden. Neben der 
Funktion bei der ZelladhSsion haben Catenine auch eine 
entscheidende Rolle bei Signaltransduktionsprozessen. B-Catenin 
in Vertebraten und das homo log e SegmentpolaritSts-Genprodukt 
Armadillo in Drosphila werden durch den Wnt/Wingless-Signalweg 
stabilisiert (Nusse, R. , Cell 89, 321-323, 1997). Dies fuhrt zu 
einer Erhohung der zytoplasmatischen, nicht an Cadherin 
gebundenen Fraktion dieser Proteine, die darauf hin mit HMG- 
Transkr iptionsf aktoren der LEF-l/TCF-Fami 1 ie wechselwirken 
konnen. Als Resultat wird B-Catenin/Airmadillo in den Zellkern 
transportiert, wo es zusammen mit den LEF/TCF-Froteinen an DNA 
bindet und bestimmte Gene aktiviert (Behrens, J. et. al., Nature 
382, 638-642, 1997). 

Dieser Signalweg spielt auch eine Rolle bei der Tumorentstehung. 
In Kolonepithel zellen wird der zytoplasmatische Pool von B- 
Catenin durch das Tumorsuppressor-Genprodukt APC (Adenomatosis 
Polyposis Coli) streng reguliert. Mutationen von APC, wie sie in 



etwa 80% aller Kolonkarzinome auftreten, ftlhren zu verkurzten 
Formen des APC Proteins , die nicht mehr in der Lage sind 6 - 
Catenin zu destabilisieren. Dadurch findet man in diesen Tumoren 
permanente Komplexe von 6-Catenin mit dem HMG-Transkriptions- 
faktor TCF-4 # welche far die Transformation der Zellen 
verantwortlich gemacht werden. Diese Theorie wird gesttitzt durch 
den kdrzlichen Befund, daB in Tumoren, in denen APC nicht 
verSndert ist, Mutationen von B-Catenin auftreten. Diese ftthren 
ebenfalls zur zytoplasmatischen Stabilisierung von B-Catenin und 
zur Assoziation mit LEF-l/TCF-Faktoren (Morin, P.J. et. al., 
Science 275, 1787-1790). 

Die Erfindung hat das Ziel, einen neuen Weg zur Verhinderung der 
Tumorentstehung zu finden. Der Erfindung liegt die Aufgabe 
zugrunde, ein Verfahren zur Kontrolle der Regulation von B- 
Catenin in Korperzellen zu entwickeln. 

Gegenstand der Erfindung ist ein neues Protein, welches an B- 
Catenin bindet und zu dessem zytoplasmatischen Abbau fOhrt. 
Dieses Protein hat die AminosSuresequenz gemSB Abb. 1 und wurde 
als CONDUCTIN bezeichnet* 

Das Erfindung beruht nun auf der eigenen Erkenntnis, daB 
Conductin Ober eine B-Catenin-BindungsdomSne an B-Catenin und 
iiber eine sogenannte RGS-Dom3ne (Regulator of G-Protein 
Signalling) an APC-Fragmente bindet. Dadurch kommt es z\im 
zytoplasmatischen Abbau von B-Catenin und in Vertebraten zur 
Blockade des Wnt/Wingless-Signalwegs. Damit ist klar, daB 
Conductin ein wichtiger Regulator der B-Catenin-Funktion ist und 
im Zusammenspiel mit APC zur Tumorsuppression beitrSgt. 

Davon abgeleitet betrifft die Erfindung ein Mittel zur Diagnose 
von Tumor erkrankungen , welches dadurch gekennzeichnet ist, daB 
das Vorhandensein und die Menge von Conductin, seiner Mutanten 
und Varianten oder s iner Teile in K6rperz lien nachgewiesen 
wird. Dieser Nachweis kann auf der Proteineben mit spezifischen 
AntikSrpern durchgefQhrt werden, speziell mit monoklonalen 



Antikorpern. 



Die Diagnose von Tumor erkrankungen kann gemSB der Erfindung auch 
auf der Genebene erfolgen. Dazu werden mit ausgewahlten Primern 
und cDNA-Sonden, die aus der Genseguenz des Conduct ins 
abgeleitet sind, 

- das Gen, das fQr Conductin, seine Mutanten und Varianten oder 
Teile davon kodiert, bzw. 

- mRNA-Sequenzen, die von diesen Genen abgelesen werden, 
nachgewiesen . 

Das erf indungsgemaBe Mittel zur Therapie von Tumorerkrankungen 
enthSlt Substanzen, die die Wirkung des Conductins im Korper 
aktivieren/reaktivieren. Das sind vor alleia Mittel, die den 
Genpromoter des Conductins aktivieren bzw. Mittel, die die 
Stabilitat der von den Conductin-Genen abgeleiteten m-RNA- 
Seguenzen erh6ht* Das Hauptziel aller dieser Mittel besteht 
erf indungsgemSB darin, die Aktivitat des Conductins in den 
Korperzellen zu erhohen. Dazu kommen u. a. kleinmolekulare 
Substanzen in Betracht, die z. B. durch High-Througput-Number- 
Screening gefunden werden. 

Die Erfindung umfaBt auch gentherapeutische Mittel, enthaltend 
Gene, die fQr Conductin, seine Mutanten und Varianten oder Teile 
davon kodieren, bzw. mRNA-Seguenzen , die von diesen Genen 
abgelesen werden. 

Unter Schutz gestellt wird ferner das neue Protein Conductin 
gemSB Abb. 1, seine Mutanten und Varianten sowie Teile davon* 
Besonders bevorzugte Teilseguenzen sind die AminosSuren 78-200 
(RGS) ,343-464 (B-Catenin-BindungsdomSne) und 782-832 
(Dishevelled Homologie-Region) . Zum Schutzumf ang gehdren auch 
Teilsequenzen des Adenomatosis Poliposis Coli (APC) , 
gekennzeichnet durch die AminosSuresequenzen 1464-1604, 1516- 
1595, 1690-1778 und 1995-2083 als RGS-Dom&nen-Interaktionsorte. 

GleichermaBen beansprucht werden die analogen cDNA-Sequenzen, 
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insbesondere die voile cDNA-Sequenz des Conduct ins (Basenpaare 
1-3197) gemdB Abb. 2 sowie die Teilsequenzen des Conductins der 
Nukleotidfolge 452-820 (RGS-Genabschnitt ) , der Nukleotidfolge 
1247-1612 (Genabschnitt der B-Catenin-Bindungsdomane) und der 
Nukleotidfolge 2564-2716 (Genabschnitt der Dishevelled 
Homologie-Region ) 

Die Erfindung wird durch die folgenden Ausf lihrungsbeispiele 
nSher erlSutert. 

Conductin wurde durch einen Hefe 2-Hybrid Screen als B-Catenin- 
interaktionspartner identif iziert . Die vollstandige cDNA-Sequenz 
wurde daraufhin isoliert und sequenziert. Die abgeleitete 
AminosSuresequenz von Conduction ist in Abb* 1 gezeigt, die 
Nukleotidseguenz in Abb. 2 und die Gegenuberstellung von 
Aminpsaure- und Nukleotidsequenz in Abb. 3. Conductin besteht 
aus 839 Aminosauren und hat ein Molekulargewicht von 92,4 kDa. 
Durch Sequenzvergleiche wurde im Conductin eine RGS-^DomSne 
(Aminosauren 78-200) und eine zu dem Protein Dishevelled 
verwandte DomSne (Aminosauren 782-832 , Dishevelled Homologie- 
Region) identif iziert (Abb. 1-3). Die B-Catenin-Bindungsdomane 
(Aminosauren 343-464) wurde durch Interaktionsstudien im 2- 
Hybrid-System entdeckt (Abb. 4). Es zeigte sich, daB diese 
Dom&ne ausreichend und notwendig fdr die Bindung an B-Catenin 
ist (Abb. 4), wohingegen die RGS- und Dishevelled Homologie- 
Region nicht beteiligt sind. Die Wechselwirkung von Conductin 
mit B-Catenin wurde auch in Co-Immunprazipitationsexperimenten 
biochemisch bewiesen. 

Die Wirkung von Conductin auf B-Catenin wurde in SW480 Zellen 
untersucht. In diesen Zellen ist das Tumor-Suppressor-Genprodukt 
APC mutiert, wodurch es zu einem Anstieg des cytoplasmatischen 
und vor allem nukleSren Gehalts von B-Catenin kommt. Die 
Einbringung von Conductin in diese Zellen fxihrt zu einem 
drastischen Abbau von B-Catenin, wodurch die Zelle von 
cytoplasmatischem und im Zellkern befindlichen B-Catenin 
depletiert wird (Abb. 4). Diese Wirkung auf den Gehalt B-Catenin 



ist gleich stark wie die von nichtmutiertem APC, woraus 
geschlossen werden Jcann , daB Conductin ebenfalls als 
Tumorsuppressor durch Regulation von B-Catenin wirkt. Es wurde 
aufierdem gezeigt, daB Conductin den Wnt/Wingless-Signalweg auch 
in Xenopus-Embryonen durch seine Wirkung auf B-Catenin hemmt. 

Es wurde auBerdem f estgestellt, daB Conductin mit APC direkt 
interagiert. APC-Fragmente von AminosSure 1464-1604, 1516-1595, 
1690-1778 und 1995-2883 wurden als Interaktionsstellen fur 
Conductin identif iziert . In Conductin erfolgt die Bindung an APC 
iiber die RGS-DomSne; dieser Bereich ist ausreichend und 
notwendig fur die Interaktion. Die anderen DomSnen in Conductin 
sind nicht beteiligt (Abb. 5). 
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Legende zu den Abbildungen: 

Abb. 1 Aminosfiureseguenz von Conductin 

Die Conductin cDNA kodiert ein Protein von 839 AminosSuren mit 
einem berechneten Molekulargewicht von 92,4 kDa. Die RGS-Domane 
(doppelt unterstrichen) , die B-Catenin-BindungsdomSne (einfach 
unterstrichen) und die Dishevelled Homologie-Region sind durch 
Fettdruck hervorgehoben . 

Abb. 2 Nukleotidsequenz von Conductin von Position 1-3199 

Die Sequenzbereiche sind analog zu Abb.l markiert. 

Abb. 3 Gecrenftberstelluncr von AminosSure- und Nukleotid sequenz 

von Conavtct in 

Abb. 4 Analyse der Interaktion von Conductin und seinen Teilen 
mit fi-Catenin 

Das Conductin Protein und abgeleitete Teilstticke sind 
schematisch dargestellt. Hervorgehoben sind die RGS-Domane (RGS) 
und die B-Catenin-Bindungsstelle (B-BD) . Die Interaktion mit B- 
Catenin wurde im Hef e 2-Hybrid Assay untersucht und als B- 
Galaktosidase Einheiten quantif iziert . Man erkennt, daB die 
Bindung an B-Catenin auf die B-Catenin-Bindungsstelle beschrankt 
ist, die anderen Teile des Proteins tragen dazu nicht bei. Der 
Abbau von B-Catenin in SW480 Zellen durch Conductin wurde nach 
transienter Expression der angegeben Proteine und 
Immunf luoreszenz-FSrbung von B-Catenin analysiert. Nur 
Teilstticke von Conductin, die an B-Catenin binden, fiihren zu 
dessen Abbau. 

Abb. 5 Analyse der Bindung von Conductin und seinen Teilen an 
Die Bindung der APC Fragmente von AminosSure 1464-1604 (APCfr.l) 
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und 1516-1595 (APCfr. 2) an Conductin und abgeleitete Teilstucke 
wurden im Hefe 2-Hybrid Assay untersucht und als B-Galaktosidase 
Einheiten quantif iziert. Die Analyse 2eigt die ausschlieBliche 
Interaktion von APC roit der RGS-Domane von Conductin. 
Vergleichbare Ergebnisse ftlr die Bindung an die RGS-DomSne 
wurden xait APC Fragmenten von AminosSure 1690-1778 und 1995-2883 
erhalten. 



MSSAVLVTLLPDPSSSFREDAPRPPVPGEEGETPPCQPSVGKVQSTKPMPVSSNARRNED 60 

GLGEPEGRASPDSPLT RWTKSLHSLLGDQDGAYIiFRTFIiEREKCV^TIJ^FWFACNGFROM 120 

NIJCDTKTIiRVT^KAIYT^YIEtWSVVSKQI^PATKTYIRDGIKKOQIGSVMFDQAQTEIOA 180 

VMEENAYQVFLTSDIYLEYV RSGGENTAYMSNGGLGSLKVLCGYLPTLNEEEEWTCADLK 2 4 0 

CKLSPTWGLSSKTLRATASVRSTETAENGFRSFKRSDPVNPYHVGSGYVFAPATSANDS 300 

ELSSDALTDDSMSMTDSSVDGVPPYRMGSKKQLQREMHRSVK ANGQVSLPHFPRTHRLPK 360 

EMTPVEPAAFAAELISRIiEIOiKI^I^SRHSI^ERLQQIREDEEKE 420 

HPLALLPPAAMKRTHKPFWTTT S PGS SRPPAVNPLVWVAI AHGPA P PTT T TSTTTISSVI 480 

PFFRLGASCPVAACPLLGGKSFLTKQTTKHVHHHYIHHHAVPKTKEEIEAEATQRVRCLC 54 0 

PGGTDYYCYSKCKSHPKAPEPLPGEQFCGSRGGTLPKRNAKGTEPGLALSARDGGMSSAA 600 

GGPQLPGEEGDRSQDVWQWMLESERQSKSKPHSAQSIRKSYPLESARAAPGERVSRHHLL 660 

GASGHSRSVARAHPFTQDPAMPPLTPPNTLAQLEEACRRLAEVSKPQKQRCCVASQQRDR 7 20 

NHSAAGQAGASPFANPSLAPEDHKEPKKLASVHALQASELWTYFFCGEEI PYRRMLKAQ 7 80 

SLTLGHFKEQLSKKGNYRYYFKKASDEFACGRVFEEIWDDETVLPMYEGRILGKVERID 8 39 



AAATAAGCAGCCGTTCGCGATGGATTTCGGGGCCACCCGGAGGCCGAGGCGTCCGCTCCC 60 
CAAAGGAGAGCTTTGCTGTAAAAGAGAGGAGGCTCACATGAGCCCCTGCTGACTTAAGAG 120 
AGACCAAGCCGATTGCTGAGAGGAACTGGAAGAAGAAAAAGGAGGAGGAGGGAAAAAAAG 180 
CAAAACAAAATCCAAACTCAGTGAGACGCTCTCCCTCACCATGAGTAGCGCCGTGTTAGT 24 0 
GACTCTCCTTCCAGATCCCAGCAGCAGCTTCCGCGAGGATGCTCCGCGGCCCCCGGTTCC 300 
GGGAGAAGAAGGGGAGACCCCACCGTGTCAGCCTAGTGTGGGCAAGGTCCAGTCCACCAA . 360 
ACCTATGCCCGTTTCCTCTAATGCTAGGCGGAATGAAGATGGACTGGGGGAGCCCGAGGG 4 20 
GCGGGCCTCCCCCGATTCCCCTTTGACCAGG TGGACCAAGTCTTTACACTCCTTGTTGGG 4 80 
TGACCAGGATGGTGCATACCTCTTCCGGACTTTCCTGGAGAGGGAGAAATGTGTGGATAC 54 0 
GCTGGACTTCTGGTTTGCTTGTAATGGGTTCAGGCAGATGAACCTGAAGGATACCAAAAC 600 
TTTGCGAGTGGCCAAAGCAATCTATAAGAGGTACATTGAGAACAACAGCGTTGTCTCCAA 660 
GCAGCTGAAGCCCGCCACCAAGACCTAGATACGAGATGGCATCAAGAAGCAACAGATCGG 720 
CTCGGTCATGTTTGACCAGGCACAGACCGAGATCCAGGCAGTGATGGAGGAAAATGCCTA 7 80 
CCAGGTGTTCTTGACTTCTGACATTTACCTGGAATATGTG AGGAGTGGGGGGGAAAACAC 84 0 
AGCTTACATGAGTAACGGGGGACTGGGGAGCCTAAAGGTCTTATGTGGCTACCTCCCCAC 900 
CTTGAATGAAGAAGAGGAGTGGACGTGTGCCGACCTCAAGTGCAAACTCTCACCCACCGT 960 
GGTTGGCTTGTCCAGCAAAACTCTTCGGGCCACCGCGAGTGTGAGATCCACGGAAACAGC 1020 
TGAAAACGGATTCAGGTCCTTCAAGAGAAGCGACCCAGTCAATCCTTATCACGTAGGTTC 1080 
CGGCTATGTCTTTGCACCAGCCACCAGTGCCAACGACAGCGAGTTATCCAGCGACGCACT 114 0 
GACCGACGATTCCATGTCCATGACGGACAGTAGCGTAGATGGAGTCCCTCCTTACCGCAT 1200 
GGGGAGTAAG AAA CAACTCCA GAGA GAG ATGCATCGCAGTGTGAAG GCCAATGGCCAAGT 1260 
GTCTCTACCTCATTTTCCGAGAACCCACCGCCTGCCCAAGGAGATGACGCCTGTGGAACC 1320 
TGCTGCCTTCGCCGCCGAGCTCATCTCCAGGCTGGAGAAACTGAAACTGGAGCTGGAAAG 1380 
C C GC CAT AG T C T GGAGGAGCGGC T GCAGCAGAT C CGGGAGGAT GAAGAAAAGGAGGGG T C 1440 
TGAGCAGGCCCTGAGCTCACGGGATGGAGCACCGGTCCAGCACCCCCTGGCCCTCCTACC 1500 
TCCGGGAGCTATGAAGAGGACCGACAAACCATTTTGGACGACCACCTCTCCAGGGTCCTC 1560 
AAGACCCCCGGCTGTCAATCCCCTGGTGTGGGTCGCTATAGCCCACGGTCCC GCTCCCCC 1620 
GACCACCACCACCAGCACCACCACCATCAGCAGTGTCATACCCTTCTTTCGACTGGGGGC 1680 
AAGCTGCCCCGTGGCTGCTTGCCCCCTCCTTGGAGGCAAGAGCTTCCTGACCAAACAGAC 17 4 0 
GACGAAGCACGTTCACCACCACTACATCCACCACCACGCCGTCCCCAAGACCAAGGAGGA 1800 
GATCGAGGCAGAAGCCACACAGAGAGTCCGCTGCCTCTGTCCTGGGGGAACAGATTATTA 1860 
TTGCTACTCCAAATGCAAAAGCCACCCGAAGGCTCCAGAGCCCCTGCCTGGGGAGCAGTT 1920 
TTGTGGCAGCAGAGGTGGTACCTTGCCAAAACGGAATGCAAAGGGCACCGAACCGGGTCT 1980 
TGCACTGTCGGCCAGGGATGGAGGGATGTCCAGTGCAGCGGGGGGCCCCCAGCTTCCTGG 204 0 
GGAAGAAGGAGACCGGTCACAGGATGTCTGGCAGTGGATGTTAGAGAGTGAGCGGCAGAG 2100 
CAAGTCCAAGCCCCATAGTGCCCAAAGCATAAGAAAGAGCTACCCATTGGAGTCTGCCCG 2160 
TGCGGCCCCAGGAGAACGAGTCAGCCGGCACCATCTGTTGGGGGCCAGCGGACACTCCCG 2220 
CTCGGTGGCCCGGGCTCACCCATTTACCCAGGACCCTGCAATGCCTCCCCTTACCCCACC 2280 
CAACACTTTGGCACAGCTAGAGGAAGCCTGCCGCAGGCTGGCAGAGGTGTCGAAGCCCCA 234 0 
GAAGCAGCGGTGCTGCGTGGCCAGTCAGCAGAGGGACAGGAACCACTCGGCTGCTGGTCA 24 00 
GGCAGGAGCCTCACCCTTCGCCAACCCAAGCCTGGCTCCAGAAGATCACAAAGAGCCAAA 24 60 
GAAACTGGCAAGTGTCCACGCGCTCCAGGCCAGTGAGCTGGTTGTCACCTACTTTTTCTG 2520 
TGGAGAAGAAATTCCATACAGGAGGATGCTGJ\AGGCTCAAAGCTTGACCCTGGGCCACTT 2580 
CAAGGAGCAGC TCAGCAAAAAGGGAAAT T ACAGGTAT TAT T TCAAGAAGGCGAGTGACGA 264 0 
ATTTGCCTGCGGACGAGTTTTTGAGGAGATCTGGGACGACGAGACAGTGCTCCCCATGTA 2700 
CGAAGGCAGGATCCTGGGCAAAGTGGAGAGGATCGACTGAGCCTTGGCCTCCTCGGCGTG 27 60 
CAACCTGGGCAAGCACCTCGGCGTGCACCATGGAGCCGAAGCCCAGAGACCCTGTCTCAG 2820 
GCCTACGCAACAGCCACGAAATATTCTGAAGGAAAATGAAACCAATTAAGAAGACAAAGC 2880 
CTAGGGAGGGACTGGCGCCTGGGCCTTCAGGAGGGCGGGGGTATGTTGATCTTCAGTCTC 294 0 
CAGGAGCCTGGGTACCGAGATGAGAAAGCCTGAACTATTTATTAAAACATGACCACTCTG 3000 
G G C T AT AG AAG AT G C T C AGTG TG T T T GAG AG AC T G AC AT AC AT AAT AG AT G AC T T CC T AG 3060 
GGTTCTGAAATTCATAGACTAAGAGAAAACTGTGTATAGCTTGCCCGCACAGGAGTCCTT 3120 
ACTGATATTTATTGAACAGTCGATTCCCCCTACCCGCCTCCCTACCCCCCGCCCCCGAGT 3180 
TTATGCTGCTTTAAACC 3197 
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274 6 GGCCTCCTCGGCGTGCAACCTGGGCAAGCACCTCGGCGTGCACCATGGAGCCGAAGCCCAGAG 2808 

2809 ACCCTGTCTCAGGCCTACGCAACAGCCACGAAATATTCTGAAGGAAAATGAAACCAATTAAGA 2871 

287 2 AGACAAAGCCTAGGGAGGGACTGGCGCCTGGGCCTTCAGGAGGGCGGGGGTATGTTGATCTTC 2934 

2935 AGTCTCCAGGAGCCTGGGTACCGAGATGAGAAAGCCTGAACTATTTATTAAAACATGACCACT 2997 

2998 CTGGGCT ATAGAAGATGCTCAGTGTGTTTGAGAGACTGACATACAT AAT AGATGACTTCCTAG 3060 

3061 GGTTCTGAAATTCATAGACTAAGAGAAAACTGTGTATAGCTTGCCCGCACAGGAGTCCTTACT 3123 

3124 GATATTT ATTGAACAGTCGATTCCCCCTACCCGCCTCCCTACCCCCCGCCCCCGAGTTTATGC 3186 

3187 TGCTTTAAACC -3' 3197 
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